18°以北中国滨海滩涂湿地分布数据集(1989‒2020

胡忠文1,徐  1,尹玉蒙1,张康永1,邬国锋1,王  2*,崔丽娟3*

1. 深圳大学自然资源部大湾区地理环境监测重点实验室,广东深圳 518060
2.
生态环境部卫星环境应用中心,北京 100094
3.
中国林业科学研究院湿地研究所, 湿地生态功能与恢复北京市重点实验室,北京 100091

  滨海滩涂湿地是我国重要的自然资源,同时也是最容易被人类活动影响的生态脆弱区。作者运用1989–2020年长时间序列遥感影像(Landsat系列影像集:Landsat 8 Surface Reflectance Tier 1/Landsat 7 Surface Reflectance Tier 1/Landsat 5 Surface Reflectance Tier 1),结合部分实地调查数据,基于谷歌地球引擎(Google Earth EngineGEE)云计算平台,开发了基于监督分类的滨海滩涂湿地空间信息,经矢量化得到18°N以北中国滨海滩涂湿地空间分布数据集(1989–2020)。该数据集时间分辨率为年,空间分辨率为30 m,数据集由256个文件组成,数据量为318 MB(压缩为1个文件,201 MB)。

关键词海岸带;滩涂湿地;中国;1989–2020

DOI: https://doi.org/10.3974/geodp.2022.01.17

CSTR: https://cstr.escience.org.cn/CSTR:20146.14.2022.01.17

数据可用性声明:

本文关联实体数据集已在《全球变化数据仓储电子杂志(中英文)》出版,可获取:

https://doi.org/10.3974/geodb.2021.10.06.V1.https://cstr.escience.org.cn/CSTR:20146.11.2021.10.06.V1.

 

1  前言

滨海湿地是介于陆地与海洋之间的过渡地带,为鱼群、候鸟等哺乳动物提供了广泛的栖息地,是自然界中极具生物多样性与生产力的生态系统[1]。近年来,由于沿海地区城镇化不断增加,我国的滨海湿地普遍面临城镇化进程所带来的威胁,发生了较为严重的湿地退化现象[2]。监测滨海湿地的空间分布格局和研究其随时间的演变特征,有利于进一步科学评估滨海湿地的生态价值,维护湿地生态系统的可持续性发展。受自然环境的限制,传统的实地调查费时费力。利用长时间序列遥感数据实现湿地的动态监测,不仅效率高、范围广,且有利于还原大量的历史湿地状况[3]。作者利用谷歌地球引擎(Google Earth Engine, GEE)提供的30-m分辨率时间序列影像数据开展相关研究,提取了1989–2020年逐年的中国滨海滩涂湿地分布图,在发表研究论文的同时,出版该数据集。

2  数据集元数据简介

18°N以北中国滨海滩涂湿地分布数据集1989–2020[4]的名称、作者、地理区域、数据年代、时间分辨率、空间分辨率、数据集组成、数据出版与共享服务平台、数据共享政策等信息见表1

 

1  18°N以北中国滨海滩涂湿地分布数据集(19892020)》元数据简表

 

 

数据集名称

18°N以北中国滨海滩涂湿地分布数据集(1989–2020

数据集短名

DCTF_China_1989_2020

作者信息

胡忠文 AAX-7567-2021, 深圳大学自然资源部大湾区地理环境监测重点实验室, zwhoo@szu.edu.cn

徐月 AAX-7694-2021, 深圳大学自然资源部大湾区地理环境监测重点实验室, xuyue19@email.szu.edu.cn

尹玉蒙 AAC-1460-2022, 深圳大学自然资源部大湾区地理环境监测重点实验室,

yinyumeng2021@email.szu.edu.cn

张康永 Y-7203-2018, 深圳大学自然资源部大湾区地理环境监测重点实验室,

zhangkangyong2016@email.szu.edu.cn

邬国锋B-8735-2018, 深圳大学自然资源部大湾区地理环境监测重点实验室, guofeng.wu@szu.edu.cn

王晨 AAX-7615-2021, 生态环境部卫星环境应用中心, wangchen_ch@163.com

崔丽娟 AAX-7996-2021, 中国林业科学研究院湿地研究所, 湿地生态功能与恢复北京市重点实验室, wetlands108@126.com

地理区域

中国沿海

数据年代

1989‒2020

时间分辨率

空间分辨率

30 m

数据格式

.shp

数据量

201 MB(压缩后)

数据集组成

1989‒2020逐年湿地分布图(共计32份),命名规则为DCTF_China_year,后四位为年份

出版与共享服务平台

全球变化科学研究数据出版系统 http://www.geodoi.ac.cn

地址

北京市朝阳区大屯路甲11100101,中国科学院地理科学与资源研究所

数据共享政策

全球变化科学研究数据出版系统的“数据”包括元数据(中英文)、通过《全球变化数据仓储电子杂志(中英文)》发表的实体数据集和通过《全球变化数据学报(中英文)》发表的数据论文。其共享政策如下:(1)“数据”以最便利的方式通过互联网系统免费向全社会开放,用户免费浏览、免费下载;(2)最终用户使用“数据”需要按照引用格式在参考文献或适当的位置标注数据来源;(3)增值服务用户或以任何形式散发和传播(包括通过计算机服务器)“数据”的用户需要与《全球变化数据学报(中英文)》编辑部签署书面协议,获得许可;(4)摘取“数据”中的部分记录创作新数据的作者需要遵循10%引用原则,即从本数据集中摘取的数据记录少于新数据集总记录量的10%,同时需要对摘取的数据记录标注数据来源[5]

数据和论文检索系统

DOI, CSTR, Crossref, DCI, CSCD, CNKI, SciEngine, WDS/ISC, GEOSS

3  研发方法

3.1 数据与方法

本数据集利用GEE提供的1989–2020Landsat系列遥感影像数据(Landsat 8/7/5 Surface Reflectance Tier 1)多光谱遥感影像,采用人工现场调绘采集样本点,并依据样本点建立滩涂湿地解译标志;进一步分析滩涂湿地的时间序列影像特征,提取关键特征作为随机森林算法的分类特征;在GEE平台实现随机森林分类算法的监督分类工作,获取中国滨海滩涂分布初步结果;最后采用基于像素的形态学处理和人工目视辅助等方法对结果进行分类后处理,获取最终的数据集产品。

3.2  监测对象与范围

3.2.1  本数据集滩涂湿地类型界定

参考已有滩涂湿地相关研究文献[6]结合实地调查和多种湿地类型在遥感影像上的解译标志,本数据集的湿地类别分为潮间带光滩和潮上带盐沼区域。其中潮间带光滩是指涨潮时被海水淹浸退潮时露出地面泥沙或砂质的潮间平地[7],潮上带盐沼是指紧连潮间带尚未被开发的自然湿地植被,例如盐碱植被、芦苇、红树林、草滩等等[8]

3.2.2  滩涂湿地监测范围

根据全国海岸带和海涂资源综合调查[9],本研究在综合考虑了研究区域的地形地貌和海岸类型的基础上,以从全球分级的高分辨率地理数据(A Global Self-consistent, Hierarchical, High-resolution Geography DatabaseGSHHG[10]中提供的海岸线为基准,将向陆延伸 10 km,向海延伸40 km的区域作为滨海滩涂资源的调查范围(见图1)。

 

1  研究区示意图(2020年滩涂湿地分布图)

3.3  算法原理

数据集研发依靠卫星对地表的周期性观测,通过获取长时间序列的滩涂湿地遥感影像,并分析光滩、盐沼等地物的时序变化特征,进一步提取统计后的关键特征,最终采用随机森林机器学习方法进行监督分类获得分类结果。

1)时间序列影像特征提取

基于GEE平台,以年为单位筛选1989–2020年的Landsat系列卫星影像,并根据像元质量波段(QA波段)对云、云阴影、雪等像元进行掩膜,使其不参与后续的监督分类算法[11]。对预处理后的影像逐景计算光谱指数,具体光谱指数计算公式见表2。不同潮位下的像元呈现周期性的时间序列特征[12],例如mNDWI随潮位的增高而增加,裸土指数随潮位的增高而降低,NDVI随植物生长周期产生季节性周期变化。为了综合全年的影像特征,并有效表征其周期性变化的特点,本研究在计算光谱指数的基础上,分别统计全年光谱特征的均值、标准差、5%25%75%95%百分值等共6个特征。因此针对每一个像素的一种指数特征,可以获得6维特征,最终7个指数特征共计42维特征。

 

2  光谱特征计算方法

光谱指数

公式

归一化植被指数(Normalized Difference Vegetation Index, NDVI[13]

改进的归一化差异水体指数(Modified Normalized Difference Water Index, MNDWI[14]

地表水分指数(Land Surface Water Index, LSWI[15]

裸土指数(Bare Soil Index, BSI[16]

改进型土壤调节植被指数(Modified Soil-Adjusted Vegetation Index, MSAVI[17]

增强植被指数(Enhanced Vegetation Index, EVI[18]

归一化建筑指数(Normalized Difference Buildup Index, NDBI[19]

注: ρRedρGreenρBlueρNir ρSwir 分别为红、绿、蓝、近红外和短波红外1波段的反射率。

2)随机森林分类

随机森林算法是一种基于分类与回归决策树(Classification And Regression TreeCART)的组合算法[20]。决策树的整体结构为树状结构,由根节点、决策节点、决策树分支以及叶节点等构成。随机森林由一系列的决策树组成,其分类算法过程如下:

输入数据:N个训练样本的原始数据集,其特征包括M维特征向量;

参数:子集的样本个数n,子集的特征向量维度F,决策树的个数Ntree

步骤一:采用bagging方法从原始训练集中随机抽取包含n个训练样本的子集;

步骤二:假设存在M个输入特征可用于决策树建模,随机抽取指定FFM)个随机特征变量,构建一个决策树;

步骤三:重复步骤一和步骤二,直至获得Ntree个决策树;

步骤四:根据随机构建的Ntree颗决策树,对输入的数据进行分类测试,将每棵决策树的分类结果汇总,所得票数最多的类别即为最终输出的结果。

3.4  技术路线

本研究基于GEE平台采用1989–2020年时间序列Landsat系列卫星影像,结合随机森林分类算法绘制1989–2020年逐年中国18°N以北滨海滩涂湿地空间分布图。技术流程如图2所示:

 

 

2  技术流程图

 

1)样本点的选择

课题组于江苏省、上海市、广东省和广西壮族自治区开展了实地调查与验证。结合遥感影像进行目视解译,确定滩涂与植被沼泽的解译标志。图3为典型地物类型在谷歌地球(Google Earth ProGEP)高分辨率影像中的解译标志,(a)为光滩,颜色调较亮,呈浅灰色,纹理均一,位于水陆交界处;(b)为草本盐沼或红树林湿地,于光滩相邻,表面生长植被,呈深绿色。(c)为水产养殖区等,形状规则,与陆地相连。(d)为陆上硬质表面如城市建成区、海岸工程用地等,处于人工岸线以上。

 

 

3  典型地物解译标志:(a) 滩涂,(b) 盐沼(红树林),(c) 陆地区域(养殖区),

(d) 陆地区域(建成区)

 

本文基于GEE高分辨率影像在研究区内影像进行目视解译,分别针对2000200520102016年的低潮位、高潮位影像进行目视判读。最终将滨海湿地划分为陆地、滩涂、植被沼泽、水域四个类别,并选取训练样本点,具体见表3

2)基于GEE平台的随机森林机器学习

GEE平台采用Google的计算基础架构来实现并行地理空间数据处理,大大缩短了数

3  分类体系及参考样本个数

地物类型

详细说明

参考样本点数量(个)

2000

2005

2010

2016

总计

滩涂

人工岸线外不常被潮水淹浸的潮上带光滩及常被水淹浸的淤泥质潮间滩

814

276

215

446

1,751

盐沼

人工岸线外往海方向未被开发的生长着一些低等植物的潮上带草滩及红树林群落形成的海岸沼泽

249

101

75

180

  605

陆地区域

海岸线向陆地方向,主要地物类型包括建成区,农业用地,人工养殖区等

727

234

183

510

1,654

水域

包括永久性水体,近海海域,河流,水产养殖区等

945

336

308

753

2,342

 

据处理的时间[12]。该平台中集成了多种机器学习方法,其中,随机森林分类器对训练数据的质量要求不高,且分类精度会随着训练数据的数量增加而增大,适用于大尺度的影像分类。本研究计算了NDVIMNDWILSWIEVIBSIMSAVINDBI 7种光谱指数,最后添加全球水深地形数据(the Earth’s surface that integrates land topography and ocean bathymetryETOPO1)作为地形特征提升分类精度,共计43维特征向量。在分类过程中,增加决策树的数目在一定程度上可能会提高分类的准确性,但也会增加计算时间,综合考虑分类需求后将决策树数量(NTree)设置为100,最大深度不受限制,每个树节点的最小样本数量为1,特征数量为变量的平方根。

3)分类后处理

采用众数滤波以排除被误分滩涂湿地的零碎斑块;进一步考虑到滩涂与植被沼泽在地理空间上相邻的特点,本研究建立了滩涂与植被沼泽的空间拓扑关系,通过空间位置筛选出与光滩相邻的植被沼泽斑块,采用Shuttle Radar Topography MissionSRTM)高程数据,将阈值设置为35 m,对滩涂湿地数据集进行了修正,以排除被错分成盐沼的岸上植被。最后以潮上带的陆上界限为人工岸线(人工养殖区,防波提等),剔除人工岸线以内和地图中被明显错分的斑块并对空白矢量洞进行填充。最终获得321989–2020年的滩涂湿地分布图。

4  数据结果与验证

4.1  数据集组成

数据集由1989–2020年全国18°N以北海岸带滩涂湿地数据组成,包含1989–2020年间逐年的滩涂湿地空间分布数据,由空间分辨率为30 m的栅格数据经过矢量化转换而成,数据格式为.shp

4.2  数据结果

我国滨海滩涂湿地的空间分布如图4所示,其中1989年国滨海滩涂湿地总面积为13,653.7 km2,光滩面积为12,840.7 km2,盐沼面积为813.0 km22020年中国滨海滩涂湿地总面积为8100.8 km2,其中光滩与盐沼面积分别占总滩涂面积的88.1%11.9%2020年相比于1989年滨海滩涂湿地面积退化了40.7%,其中光滩减少了44.4%,盐沼增加了18.7%。滩涂湿地主要出现在平坦海岸线和河口区域,如2020年江苏盐城滩涂湿地面积占总湿地面积的21.0%,长江口、珠江口、黄河口以及辽河口等河口湿地面积约占总面积的22.3%

 

4  典型区域滨海滩涂湿地空间分布图,(a)辽河口湿地,(b)黄河口湿地,(c)江苏盐城沿岸湿地

 

4.3  数据结果验证

根据研究区范围随机生成532个随机点,将其导入谷歌地球软件,并对1989–2020年每年的卫星影像为底图对随机点所属的地物类型进行目视判读,将地物类型被判读为光滩、盐沼和其他(光滩类别147个,盐沼类别103个,其他类别282个)。判读结果结合本研究得到的提取结果生成混淆矩阵,得出Kappa系数和总体精度,各年份精度评价结果如图5所示。在1989–2020年全国滨海湿地遥感制图产品中,遥感制图结果精度评价的平均总体精度高达90.84%,平均Kappa系数高达0.85。其中,历年总体精度不低于88%Kappa系数不低于0.80,表明该套遥感制图产品分类精度较高。

 

5  滨海滩涂湿地精度验证结果

5  讨论和总结

本文利用30 m分辨率的时间序列影像分析了中国18°N以北海岸带滩涂湿地特征,进行了1989–2020逐年的湿地制图和精度检验。该数据集具有30-m空间分辨率,一年的时间分辨率,覆盖中国全部海岸带区域,精度验证表明该数据集结果可靠。该数据集可应用于中国滩涂湿地演变分析,服务于中国海岸带区域的生态系统服务评价、制定海岸带可持续发展战略等。

 

作者分工:崔丽娟、王晨、邬国锋对数据集的开发做了总体设计;徐月、张康永采集和处理了样本数据、遥感影像数据;胡忠文、张康永设计了模型和算法;尹玉蒙做了数据验证;胡忠文、徐月撰写了数据论文等。

 

利益冲突声明:本研究不存在研究者以及与公开研究成果有关的利益冲突。

参考文献

[1]      Zhang, X. L., Li, P. Y, Li, P., et al. Present conditions and prospects of study on soastal wetlands in China [J]. Advances in Marine Science, 2005, 23(1): 8795.

[2]      Yao, H. Characterizing landuse changes in 1990–2010 in the coastal zone of Nantong, Jiangsu province, China [J]. Ocean & Coastal Management, 2013, 71: 10815.

[3]      Wen, Q., Zhang, Z., Xu, J., et al. Spatial and temporal change of wetlands in Bohai rim during 2000–2008: an analysis based on satellite images [J]. Journal of Remote Sensing, 2011, 15(1): 183200.

[4]      胡忠文, 徐月, 尹玉蒙等. 18°N以北中国滨海滩涂湿地分布数据集(19892020[J/DB/OL]. 全球变化数据仓储电子杂志, 2021. https://doi.org/10.3974/geodb.2021.10.06.V1. https://cstr.escience.org. cn/CSTR:20146.11.2021.10.06.V1.

[5]      全球变化科学研究数据出版系统. 全球变化科学研究数据共享政策[OL]. https://doi.org/10.3974/dp.

policy.2014. 05 (2017年更新).

[6]      王刚. 沿海滩涂的概念界定[J]. 中国渔业经济, 2013, (1): 99104.

[7]      方如康. 环境学词典[M]. 北京: 科学出版社, 2003.

[8]      彭建, 王仰麟. 我国沿海滩涂的研究 [J]. 北京大学学报(自然科学版), 2000, 36(6): 832839.

[9]      苏胜金. 七年全国海岸带和海涂资源综合调查综述[J]. 海洋与海岸带开发, 1988(2): 3032.

[10]   Wessel, P., Smith, W. H. F. A global, self-consistent, hierarchical, high-resolution shoreline database [J]. Journal of Geophysical Research Solid Earth, 1996, 101(B4): 87418743.

[11]   Foga, S., Scaramuzza, P, L., Guo, S., et al. Cloud detection algorithm comparison and validation for operational Landsat data products [J]. Remote Sensing of Environment, 2017, 194: 379390.

[12]   Zhang, K. Y., Dong, X. Y., Liu, Z. G., et al. Mapping tidal flats with Landsat 8 images and Google Earth engine: a case study of the China’s eastern coastal zone circa 2015 [J]. Remote Sensing, 2019, 11(8): 924.

[13]   Cheng, B., Liu, Y., Liu, X., et al. Research on extraction method of coastal aquaculture areas on high resolution remote sensing image based on multi-features fusion [J]. Remote Sensing Technology and Application, 2018, 33(2): 296304.

[14]   Gong, C., Gang, D., Wang, D. Remote sensing monitoring water area of Dongting lake based on MNDWI [J]. Journal of Water Resources Research, 2015, 4(3): 234239.

[15]   Dong, Z. Y., Wang, Z. M., Liu, D. W., et al. Mapping wetland areas using Landsat-derived NDVI and LSWI: a case study of west Songnen Plain, Northeast China [J]. Journal of the Indian Society of Remote Sensing, 2014, 42(3): 569576.

[16]   Nguyen, C. T., Chidthaisong, A., Diem, P. K., et al. A modified bare soil index to identify bare land features during agricultural fallow-period in Southeast Asia using Landsat 8 [J]. Land, 2021, 10(3): 118.

[17]   Guo, B., Zang, W. Q., Zhang, R. Soil salizanation information in the Yellow River Delta based on feature surface models using Landsat 8 OLI Data [J]. Ieee Access, 2020, 11(1): 288300.

[18]   Zhang, J. H., Feng, L. L., Yao, F. M. Improved maize cultivated area estimation over a large scale combining MODIS-EVI time series data and crop phenological information [J]. Isprs Journal of Photogrammetry and Remote Sensing, 2014, 94: 102113.

[19]   Malik, M. S., Shukla, J. P., MishraI, S. Relationship of LST, NDBI and NDVI using Landsat-8 data in Kandaihimmat Watershed, Hoshangabad, India [J]. Indian Journal of Geo-Marine Sciences, 2019, 48(1): 25–31.

[20]   Breiman, L. Random forests [J]. Machine Learning, 2001, 45(1): 3532.